Teste de BI

Candidato: Jayme Anchante

Questões R básico:

1. Usando mtcars, trazer a média de miles per galon da marca Mercedez. Atribuir isso a uma variável x.


In [1]:
data(mtcars)
dim(mtcars)


  1. 32
  2. 11

In [2]:
head(mtcars, 32)


mpgcyldisphpdratwtqsecvsamgearcarb
Mazda RX421.0 6 160.0110 3.90 2.62016.460 1 4 4
Mazda RX4 Wag21.0 6 160.0110 3.90 2.87517.020 1 4 4
Datsun 71022.8 4 108.0 93 3.85 2.32018.611 1 4 1
Hornet 4 Drive21.4 6 258.0110 3.08 3.21519.441 0 3 1
Hornet Sportabout18.7 8 360.0175 3.15 3.44017.020 0 3 2
Valiant18.1 6 225.0105 2.76 3.46020.221 0 3 1
Duster 36014.3 8 360.0245 3.21 3.57015.840 0 3 4
Merc 240D24.4 4 146.7 62 3.69 3.19020.001 0 4 2
Merc 23022.8 4 140.8 95 3.92 3.15022.901 0 4 2
Merc 28019.2 6 167.6123 3.92 3.44018.301 0 4 4
Merc 280C17.8 6 167.6123 3.92 3.44018.901 0 4 4
Merc 450SE16.4 8 275.8180 3.07 4.07017.400 0 3 3
Merc 450SL17.3 8 275.8180 3.07 3.73017.600 0 3 3
Merc 450SLC15.2 8 275.8180 3.07 3.78018.000 0 3 3
Cadillac Fleetwood10.4 8 472.0205 2.93 5.25017.980 0 3 4
Lincoln Continental10.4 8 460.0215 3.00 5.42417.820 0 3 4
Chrysler Imperial14.7 8 440.0230 3.23 5.34517.420 0 3 4
Fiat 12832.4 4 78.7 66 4.08 2.20019.471 1 4 1
Honda Civic30.4 4 75.7 52 4.93 1.61518.521 1 4 2
Toyota Corolla33.9 4 71.1 65 4.22 1.83519.901 1 4 1
Toyota Corona21.5 4 120.1 97 3.70 2.46520.011 0 3 1
Dodge Challenger15.5 8 318.0150 2.76 3.52016.870 0 3 2
AMC Javelin15.2 8 304.0150 3.15 3.43517.300 0 3 2
Camaro Z2813.3 8 350.0245 3.73 3.84015.410 0 3 4
Pontiac Firebird19.2 8 400.0175 3.08 3.84517.050 0 3 2
Fiat X1-927.3 4 79.0 66 4.08 1.93518.901 1 4 1
Porsche 914-226.0 4 120.3 91 4.43 2.14016.700 1 5 2
Lotus Europa30.4 4 95.1113 3.77 1.51316.901 1 5 2
Ford Pantera L15.8 8 351.0264 4.22 3.17014.500 1 5 4
Ferrari Dino19.7 6 145.0175 3.62 2.77015.500 1 5 6
Maserati Bora15.0 8 301.0335 3.54 3.57014.600 1 5 8
Volvo 142E21.4 4 121.0109 4.11 2.78018.601 1 4 2

In [3]:
x <- mean(mtcars$mpg[substr(rownames(mtcars), 0, 4) == 'Merc'])
x


19.0142857142857

2. Testar se há correlação entre o peso do carro e o consumo de gasolina. Existe? Por quê?


In [4]:
mtcars[c('mpg', 'wt')]


mpgwt
Mazda RX421.0 2.620
Mazda RX4 Wag21.0 2.875
Datsun 71022.8 2.320
Hornet 4 Drive21.4 3.215
Hornet Sportabout18.7 3.440
Valiant18.1 3.460
Duster 36014.3 3.570
Merc 240D24.4 3.190
Merc 23022.8 3.150
Merc 28019.2 3.440
Merc 280C17.8 3.440
Merc 450SE16.4 4.070
Merc 450SL17.3 3.730
Merc 450SLC15.2 3.780
Cadillac Fleetwood10.4 5.250
Lincoln Continental10.4 5.424
Chrysler Imperial14.7 5.345
Fiat 12832.4 2.200
Honda Civic30.4 1.615
Toyota Corolla33.9 1.835
Toyota Corona21.5 2.465
Dodge Challenger15.5 3.520
AMC Javelin15.2 3.435
Camaro Z2813.3 3.840
Pontiac Firebird19.2 3.845
Fiat X1-927.3 1.935
Porsche 914-226.0 2.140
Lotus Europa30.4 1.513
Ford Pantera L15.8 3.170
Ferrari Dino19.7 2.770
Maserati Bora15.0 3.570
Volvo 142E21.4 2.780

In [5]:
cor(mtcars[c('mpg', 'wt')])


mpgwt
mpg 1.0000000-0.8676594
wt-0.8676594 1.0000000

In [6]:
library(ggplot2)

# Basic scatter plot with regression line:
ggplot(mtcars, aes(x=wt, y=mpg)) + geom_point(size = 3) + geom_smooth(method=lm)


Há "forte" correlação linear negativa ou inversa entre peso e quilometragem dos veículos: quanto maior o peso, menor a quilometragem. Provavelmente, o motor "exige" mais combustível de veículos mais pesados do que dos mais leves para locomover-se.

3. Usando quakes, qual é a maior magnitude de um terremoto? e qual a magnitude média? e o desvio entre as magnitudes?


In [7]:
data(quakes)
dim(quakes)


  1. 1000
  2. 5

In [8]:
head(quakes)


latlongdepthmagstations
-20.42181.62562 4.8 41
-20.62181.03650 4.2 15
-26.00184.10 42 5.4 43
-17.97181.66626 4.1 19
-20.42181.96649 4.0 11
-19.68184.31195 4.0 12

In [9]:
cat('A maior magnitude de um terremoto é', max(quakes$mag), '!')


A maior magnitude de um terremoto é 6.4 !

In [10]:
cat('A magnitude média é', mean(quakes$mag))


A magnitude média é 4.6204

In [11]:
cat('O desvio padrão das magnitudes é de', sd(quakes$mag))


O desvio padrão das magnitudes é de 0.402773

4. Usando cars, qual é a distância de frenagem se o carro estiver a 90 milhas por hora.


In [12]:
data(cars)
dim(cars)


  1. 50
  2. 2

In [13]:
tail(cars)


speeddist
4523 54
4624 70
4724 92
4824 93
4924 120
5025 85

In [14]:
max(cars$speed)


25

In [15]:
# Basic scatter plot with regression line:
ggplot(cars, aes(x=speed, y=dist)) + geom_point(size = 3) + geom_smooth(method=lm)



In [16]:
cor(cars)


speeddist
speed1.00000000.8068949
dist0.80689491.0000000

In [17]:
fit <- lm('dist ~ speed', data = cars)
summary(fit)


Call:
lm(formula = "dist ~ speed", data = cars)

Residuals:
    Min      1Q  Median      3Q     Max 
-29.069  -9.525  -2.272   9.215  43.201 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -17.5791     6.7584  -2.601   0.0123 *  
speed         3.9324     0.4155   9.464 1.49e-12 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 15.38 on 48 degrees of freedom
Multiple R-squared:  0.6511,	Adjusted R-squared:  0.6438 
F-statistic: 89.57 on 1 and 48 DF,  p-value: 1.49e-12

In [18]:
newvalue <- data.frame(speed = 90)
cat('A distância de frenagem é de', predict.lm(fit, newvalue), 'ft caso o carro esteja a 90 mph')


A distância de frenagem é de 336.3377 ft caso o carro esteja a 90 mph